针对机场道面地下目标检测任务中,探地雷达(GPR)生成的B-scan图背景复杂、包含大量噪声,尤其是单个B-scan图不能反映地下目标的完整信息等问题,构建一种三维通道和空间注意力的UNet(3D-CSA-UNet)模型对地下目标进行自动检测。首先,设计三维通道和空间注意力并行模块(3D-CS-Block),使模型重点关注雷达C-scan中的地下目标信息,抑制背景和噪声的干扰;其次,设计多尺度的三维分割模型从雷达C-scan中提取不同大小的特征图,以增强3D-CS-Block提取目标特征的能力;最后,使用交叉熵损失函数计算每个尺度下特征图的损失值,从而提高模型的检测精度。在采集的实际机场道面地下目标数据集上,相较于3D-FCN、3D-UNet等模型,3D-CSA-UNet对于脱空、钢筋和钢筋平行目标预测的平均F1至少提高12.33、9.05、11.05个百分点。实验结果表明,3D-CSA-UNet可以较好地满足工程实际要求。
针对基于循环神经网络(RNN)的人体运动合成方法存在首帧跳变,进而影响生成运动的质量的问题,提出一种带有隐状态初始化的人体运动合成方法,将初始隐状态作为自变量,利用神经网络的目标函数作为优化目标,并使用梯度下降的方法进行优化求解,以得到一个合适的初始隐状态。相较于编码器-循环-解码器(ERD)、残差门控循环单元(RGRU)模型,所提方法在首帧的预测误差分别减小63.51%和6.90%,10帧的总误差分别减小50.00%和4.89%。实验结果表明,该方法无论是运动合成质量还是运动预测精度都优于不进行初始隐状态估计的方法;它通过准确估计基于RNN的人体运动模型的首帧隐状态可提升运动合成的质量,并且为实时安全监测中的动作识别模型提供可靠的数据支持。